ISSN 1998-0663 (print), English version: ISSN 2587-814X (print), |
Зеленков Ю. А.1, Лашкевич Е. В.1Контрфактуальные объяснения на основе генерации синтетических данных
2024.
№ 3 Vol 18.
С. 24–40
[содержание номера]
Контрфактуальное объяснение – это генерация для заданного экземпляра множества объектов, которые принадлежат к противоположному классу, но находятся в пространстве признаков максимально близко к объясняемому фактуалу. Известные алгоритмы, решающие эту задачу, как правило, основаны на сложных моделях, требующих большого объема обучающих данных и значительных вычислительных затрат. В данной статье предлагается метод, который включает два этапа. На первом этапе на основе простых статистических моделей (гауссовская копула, последовательная модель на основе условных распределений, байесовская сеть и др.) генерируется синтетическое множество потенциальных контрфактуалов, на втором – производится отбор объектов, удовлетворяющих ограничениям правдоподобия, близости, разнообразия и т.д. Такая организация позволяет сделать процесс прозрачным, управляемым и повторно использовать модели генерации. Эксперименты на трех свободно распространяемых наборах данных показали, что предложенный метод позволяет добиться результатов, как минимум, сравнимых с известными алгоритмами контрфактуальных объяснений, а в ряде случаев их превосходит, особенно на малых наборах данных. Наиболее эффективной моделью генерации при этом является байесовская сеть.
Библиографическое описание:
Зеленков Ю.А., Лашкевич Е.В. Контрфактуальные объяснения на основе генерации синтетических данных // Бизнес-информатика. 2024. Т. 18. № 3. С. 24–40. DOI: 10.17323/2587-814X.2024.3.24.40 |
|